abc Matlab - elektronski priručnik
VII dio Dodaci /APPENDIX/ - 7.3. Osnove deskriptivne statistike

7.3.1. Kvantitativna diskretna statistička obilježja

Pretpostavimo da imamo zadan statistički niz modaliteta nekog kvantitativnog diskretnog obilježja (tj. podataka dobijenim brojanjem):

a1, a2, …, an

(Tih podataka ima konačno mnogo, tj. n  N.) Želimo te podatke prikazati tablično i grafički, te ih opisati pomoću odgovarajućih veličina. Osnovna veličina pri tabličnom prikazu podataka je apsolutna frekvencija nekog podatka. Ako se modalitet ai u zadanom statističkom nizu javlja ukupno fi puta, onda kažemo da je apsolutna frekvencija modaliteta ai jednaka fi.

Usko vezana uz apsolutnu je i tzv. relativna frekvencija (označimo je s ri). Ona je jednaka količniku apsolutne frekvencije fi i ukupnog broja članova niza iskazanom u procentima:

(Naime,  je uvijek decimalan broj u segmentu [0,1], pa ga je prikladno zapisati u procentima.) Ako modalitet ai ima relativnu frekvenciju ri %, to znači da je ri % svih članova niza jednako ai.

Postoji još jedna vrsta frekvencija, a to su tzv. kumulativne frekvencije koje mogu biti kumulativne apsolutne, odnosno kumulativne relativne frekvencije ''manje od'' i kumulativne apsolutne, odnosno kumulativne relativne frekvencije ''veće od''. Da bismo uopšte mogli računati bilo koju kumulativnu frekvenciju, zadane modalitete moramo sortirati, odnosno poredati ili od najvećeg prema najmanjem ili od najmanjeg prema najvećem. MATLAB-ova funkcija sort reda podatke od najmanjeg prema najvećem pa ćemo koristiti takav poredak podataka. Radi jednostavnosti pretpostavimo da su zadani podaci već sortirani, tj. da je

a1, a2, …, an

sortiran niz modaliteta od najmanjeg prema najvećem. Tada je:

kumulativna apsolutna frekvencija ''manje od'' modaliteta ai jednaka zbiru apsolutnih frekvencija svih modaliteta (elemenata niza) koji su manji ili jednaki ai ;
- kumulativna apsoltuna frekvencija ''veće od'' modaliteta ai jednaka zbiru apsolutnih frekvencija svih modaliteta (elemenata niza) koji su veći ili jednaki ai ;
- kumulativna relativna frekvencija ''manje od'' modaliteta ai jednaka količniku apsolutne kumulativne frekvencije ''manje od'' tog modaliteta i zbira apsolutnih frekvencija svih modaliteta, pri čemu se taj količnik obavezno iskazuje u procentima,
- kumulativna relativna frekvencija ''veće od'' modaliteta ai jednaka količniku apsolutne kumulativne frekvencije ''veće od'' tog modaliteta i zbira apsolutnih frekvencija svih modaliteta, pri čemu se taj količnik obavezno iskazuje u procentima.

Na kraju ovog kratkog pregleda statističkih veličina spomenimo i osnovne numeričke parametre statističkog niza. Njihov pregled je dat u donjoj tablici.

Naziv parametra

MATLAB-ova funkcija
za računanje parametra

Interpretacija
parametra

aritmetička sredina

MEAN

prosječna vrijednost članova niza

varijansa

VAR

prosječno kvadratno odstupanje
članova niza od aritmetičke sredine

standardna devijacija

STD

prosječno odstupanje članova niza od
aritmetičke sredine

koeficijent varijacije

ne postoji

mjera raspršenosti podataka, jednaka je
količniku standardne devijacije i
aritmetičke sredine iskazanom u
procentima

Budući da ćemo sve podatke obrađivati i analizirati pomoću MATLAB-a, odmah uvedimo dogovor da ''sirove'', odnosno neobrađene podatke zapisujemo matrično u obliku jednoredne matrice. Razlog tome je što sve gornje funkcije imaju matričnu ulaznu varijablu. Zbog raznih praktičnih razloga (najčešći je pogreška pri unosu podatka) prikladno je ''sirove'', odnosno neobrađene podatke zapisati u neku običnu m–datoteku koju u svakom trenutku možemo pozvati iz radnog prostora jednostavnim navođenjem njenog imena.

Pogledajmo na primjerima kako se tablično i grafički obrađuju nizovi ''sirovih'' podataka.

 

Kako stvoriti jednu običnu m-datoteku    <    Index    >    Kvantitativna diskretna statistička obilježja - Primjer 1.